Comparaison de distances et noyaux classiques par degré d'équivalence des ordres induits
نویسندگان
چکیده
Résumé. Le choix d’une mesure pour comparer les données est au cœur des tâches de recherche d’information et d’apprentissage automatique. Nous considérons ici ce problème dans le cas où seul l’ordre induit par la mesure importe, et non les valeurs numériques qu’elle fournit : cette situation est caractéristique des moteurs de recherche de documents par exemple. Nous étudions dans ce cadre les mesures de comparaison classiques pour données numériques, telles que les distances et les noyaux les plus courants. Nous identifions les mesures équivalentes, qui induisent toujours le même ordre ; pour les mesures non équivalentes, nous quantifions leur désaccord par des degrés d’équivalence basés sur le coefficient de Kendall généralisé. Nous étudions les équivalences et quasiéquivalences à la fois sur les plans théorique et expérimental.
منابع مشابه
Description de formes schizogoniques de Babesia bigemina. Comparaison avec des formes identiques, decrites par E. Dschunkowsky, 1937, sous le nom Lushia bovis
متن کامل
Recherches pour la détermination du degré des propriétés antigéniques de quelques souches vaccinales du virus de la maladie de Newcastle administrées par voie oculaire à des poulets
متن کامل
Diagnosticabilité de motifs de supervision par dépliage de réseaux de Petri
Résumé—Ce papier s’intéresse au problème de la diagnosticabilité des motifs de supervision dans les systèmes à événements discrets. Ces motifs permettent de prendre en compte des comportements de fautes complexes. La méthode d’analyse de diagnosticabilité s’appuie sur l’utilisation des réseaux de Petri et sur les méthodes de dépliage de manière à appréhender les problèmes d’explosion combinatoi...
متن کاملUne mesure de similarité entre phrases basée sur des noyaux sémantiques
Résumé. Nous proposons une nouvelle approche pour le calcul de similarité sémantique entre phrases en utilisant les noyaux sémantiques qui les composent. Ces noyaux, sous la forme de triplets (sujet, verbe et objet) sont supposés porteurs de l’information des phrases dont ils sont extraits. Sur la base de la comparaison sémantique de noyaux, on extrait un ensemble d’indicateurs descriptifs. Nou...
متن کاملTools for Real-life Vehicle Routing Problems with Transshipment Par
véhicules aient la possibilité d'effectuer plusieurs arrêts sur leur route, nous proposons une heuristique d'agrégation des sites. Cela a également l'avan-tage de réduire davantage la taille du problème. Ce modèle étant résolu, nous lançons une exécution d'ILOG TPO avec les chemins d'ordres de transport figés, puis à partir de la solution finale de cette exécution, nous relançons ILOG TPO sans ...
متن کامل